导语
多尺度的空间异质性的是现实复杂系统的主要特征之一。其中,社会经济区隔本质上是城市空间复杂系统大规模异质性的涌现,典型的例子包括种族、收入、教育或宗教的社会区隔。通过城市空间网络关系的构建,这篇文章提出了一个空间分布的非参数度量方法。作者通过复杂网络上随机游走的时间统计量,衡量了不同大小、形状或特殊微观特征的城市区域的社会隔离,并证明了这种方法可以描述不同尺度上的空间区隔的涌现。
关键词:复杂网络,社会区隔,随机游走,复杂社会系统,城市科学
论文题目:
Quantifying ethnic segregation in cities through random walks
论文链接:https://www.nature.com/articles/s41467-022-33344-3
空间异质性是各种复杂系统的主要特点之一,从城市到区域生态系统,这些组织中存在的空间模式对其功能形成和演变都有很大影响。因此,从地理学到生态学,从经济学到工程学,复杂空间模式的描述和挖掘都受到广泛的关注。这个领域中一个特别引人注目的问题是空间区隔的量化,即一个系统的单位在局部紧密的区域周围形成均匀集聚的趋势,这本质上涉及空间异质性的计算。典型的例子是城市社区按社会经济指标的异质性分布,包括种族、收入、教育或宗教的社会区隔,这与城市的财富分配公平性、公共服务供给以及制度性歧视等方面息息相关。然而,我们对如何量化城市空间区隔,或者比较不同城市系统中的隔离水平,还没有达成共识。因为现有文献中提出的大多数量化方法都取决于街区定义的尺度,取决于可用的人口普查数据的颗粒度,或者取决于自由参数的存在,缺乏一个在不同城市系统中多尺度的比较方法。这篇文章基于复杂网络的随机游走,提出一个量化空间复杂系统的多层次异质性和区隔性的框架。具体来说,城市中蕴含着丰富的网络关系,比如人口普查区的相邻关系、城市交通、通勤关系等。这一框架本质上是计算无偏见的随机行走在这些网络得到的类覆盖时间(Class Coverage Time,CCT)的空间分布,即当从一个网络普通节点开始时,随机行走访问系统中所有类别的某一部分所需的预期步骤数,本质上是使用图扩散方法测量空间异质性。如图1所示,我们将城市中的街区映射为网络中相邻关系的节点,每个节点具有一个种类的属性。在随机均匀的种族空间分布图中(图1a),如果步行者从一个红色区开始,通常在走了一小段路后就会遇到一个浅黄色的区域。这是因为图1a中的空间模式是没有区隔的,没有任何颜色的同质化集群。相反,如果步行者从图1b的红色大集群出发,一般来说,它需要相当多的时间才能到达一个浅黄色的区域。这是因为图1b中的所有街区都被组织成明显的空间集群。因此,一个空间系统的类覆盖时间越长,说明社会区隔越严重。这些类可以根据具体的研究情境设置为收入、教育、公共服务以及种族等具体社会属性。图1:七个种族与大伦敦地区各区联系的虚构地图。(a)种族在整个城市中均匀地随机分布,以模拟一个“最大限度的”同质化和非隔离的空间模式。在这种情况下,从任何一个区出发的随机步行者将在相对较少的步数内接触到所有的其他种族。(b)人为地强加了大量的种族聚集。在这种情况下,从集群中间出发的步行者将需要更多的时间来访问所有其他种族。因此,我们可以使用类覆盖时间的统计数据来量化一个城市地区的区隔和异质性水平。
上述方法使我们能够比较具有不同类别数量,并具有不同的形状、大小和尺度的特征复杂空间系统。如果城市中倾向于形成相互区隔的同质群体,那么访问网络中所有节点所需的步数实际上取决于起始节点,包括起始节点所属集群的形状、大小和深度,以及系统中存在的其他集群。一般来说,类覆盖时间的空间分布的异质性越高,将对应于更高和更严格的空间约束,并将标志着区隔的存在。图2:网络的大小和类的数量对类覆盖时间的影响。平均类覆盖时间 μ(c) 与不同网格网络中类数量的关系。
利用这一方法,作者进一步比较了英国和美国大都市地区的种族居住隔离情况。在英国的数据集中,民族被分为 250 类,而美国的数据报告了 64 个不同的类。在图 3 中,蓝色和绿色区域,对应于类覆盖时间较小的区域,即更容易进入所有种族的区域。有趣的是,这些结果似乎并不太依赖于空间模式的取样粒度,而当我们要描述或者量化一个空间系统存在的模式是,尺度是必须要考虑的。英国的人口普查考虑了多达 250 个种族,而美国的人口普查只有 64 类。通过归一化,这项工作中提出的基于图扩散的空间区隔测量方法,可以考虑到这种尺度依赖性,从而使我们能够在英国的一个城市和美国的一个城市之间进行公平比较。即通过归一化的类覆盖时间,我们可以发现不同国家城市系统都存在某种程度的社会区隔,与它们的形状和大小无关。换句话说,这种基于复杂网络的方法有效地消除了由空间尺度的差异引起的大部分不希望出现的传统偏见。即使作者只关注了种族的社会区隔特征,但这里介绍的方法可以用来量化任何分类变量分布的空间差异和空间多样性,包括社会经济指标,如收入、获得服务、教育水平等。使得它们适合于比较同一变量在不同系统中的空间异质性,而不考虑其特殊的大小和形状,不考虑每个系统中不同类别的实际数量,也不考虑空间信息汇总的粒度。这项研究的一个非常有趣的发现是,基于随机游走的类覆盖时间的测量方法表明,所有复杂系统都存在某种程度的异质性现象,而这与它们的形状和大小是无关的。比如,有研究发现高收入家庭的聚集趋势随着城市规模的扩大而增加,并且在所有城市中都存在。这一事实表明空间区隔是一个强有力的涌现现象。即使它不是由实际的空间限制决定的,它也往往是由当地的人口分布和一些内在的聚集动力所驱动的,这些动力让空间区隔的模式出现并随着时间的推移而巩固下来。作者的方法本质上是基于第性一原理的一套衡量标准,试图更好地捕捉这些模式在不同尺度上的涌现。然而,这个方法却无法告知我们空间区隔涌现背后的动力学是什么,即背后的因果关系,因为这一指标本质上是对一个复杂空间系统的所有相关空间尺度的信息的整合。对空间区隔涌现的动力学的分析或许是一个值得探索的方向。集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「我的集智」推送论文信息。扫描下方二维码即可一键订阅: